package org.fujene.term;

// Removes HTML tags
public class ContentRemover{
	private static String[] blackList = { "a", "b", "big", "blockquote", "br", "blink", "center", "em",
			"font", "hr", "i", "img", "marquee", "p", "s", "small", "strong", "strike", "u", "applet",
			"area", "bgsound", "body", "button", "caption", "comment", "dd", "div", "dl", "dt", "embed",
			"fieldset", "form", "frame", "frameset", "h1", "h2", "h3", "h4", "h5", "h6", "head", "html",
			"iframe", "input", "label", "legend", "li", "link", "map", "meta", "meta", "noframes", "object",
			"ol", "option", "param", "pre", "script", "select", "span", "style", "table", "tbody", "td",
			"textarea", "th", "title", "tr", "ul", "!--", "wbr", "nobr" };

	public static String removeTag(String content){
		String removed = new String();
		int written = 0;
		for(int i = 0; i < content.length(); i++){
			if(content.charAt(i) != '<') continue;
			for(int j = 0; j < blackList.length; j++){
				String substr = content.substring(i + 1);
				if(substr.startsWith(blackList[j])){
					removed.concat(content.substring(written, i));
					i = content.indexOf('>', i) + 1;
					if(i == 0) return removed;
					written = i;
					break;
				}
			}
		}

		return removed;
	}
}
